Google facilita la búsqueda de conjuntos de datos en línea

Google facilita la búsqueda de conjuntos de datos en línea

A los investigadores y académicos que buscan conjuntos de datos en línea ahora les resultará más fácil hacerlo, ya que la búsqueda de conjuntos de datos de Google ahora está fuera de beta e incluye nuevas herramientas para filtrar mejor las búsquedas con un acceso a casi 25 millones de conjuntos de datos. Dataset Search se lanzó por primera vez en 2018 como parte del objetivo de la compañía de poner fin a la fragmentación de los datos de acceso abierto. Aunque muchas universidades, gobiernos y laboratorios publican sus datos en línea, a menudo es difícil encontrarlos utilizando los motores de búsqueda tradicionales. Sin embargo, al agregar etiquetas de metadatos de código abierto a sus páginas web, estos grupos pueden indexar sus datos mediante la búsqueda del conjunto de datos de Google. Aunque el gigante de las búsquedas no comparte cifras de uso específicas para Dataset Search, la compañía dice que "cientos de miles de usuarios" lo han intentado desde su lanzamiento y que el usuario La herramienta ha recibido un apoyo positivo de la comunidad científica.

The Verge habló con un investigador de Google AI que ayudó a crear la herramienta llamada Natasha Noy, quien dijo que "la mayoría de los repositorios (de datos) han respondido muy bien" y que Dataset Search tiene incluso alentó a las instituciones científicas más antiguas a tomar "la publicación de metadatos más en serio". Ahora que la herramienta está fuera de fase beta, Google le ha agregado nuevas funciones, incluida la capacidad de filtrar datos por tipo (tablas, imágenes, texto, etc.), lo que la hace de uso gratuito. # 39; uso y también el área geográfica que cubre. La búsqueda de conjuntos de datos ahora también está disponible en dispositivos móviles y ha desarrollado descripciones de conjuntos de datos. Según Google, el motor de búsqueda de la herramienta cubre casi 25 millones de conjuntos de datos, aunque es solo una "fracción de los conjuntos de datos en la web". Los temas más importantes indexados por Dataset Search incluyen geociencia, biología y agricultura con educación, clima, cáncer, delincuencia, fútbol y perros como las consultas más comunes. Hacer que los datos estén disponibles para los usuarios es lo que Google hace mejor y la compañía planea continuar agregando más conjuntos de datos a la búsqueda de conjuntos de datos. Via The Verge